Rubin CPX 深度解读(转发)
Rubin CPX于2025年9月9日发布,是首款专为海量上下文AI处理(如百万token推理)设计的CUDA GPU。CPX算力达30PFLOPS (NVFP4精度),配备128GB GDDR7内存,能处理百万 tokens 量级的代码和生成式视频,猜测是应
Rubin CPX于2025年9月9日发布,是首款专为海量上下文AI处理(如百万token推理)设计的CUDA GPU。CPX算力达30PFLOPS (NVFP4精度),配备128GB GDDR7内存,能处理百万 tokens 量级的代码和生成式视频,猜测是应
英伟达推出的 Rubin CPX 面向“长上下文”人工智能应用,宣称可一次处理百万级别的 token,这对于整合大型代码仓库、小时级视频内容的生成与检索具有重要意义。行业专家对这款芯片的架构、系统化部署和潜在市场影响进行了解读,并指出企业在向超大上下文模型迁移
在周二的 AI 基础设施峰会上,英伟达宣布推出一款名为Rubin CPX(Rubin Context GPUs)的新 GPU,专为超过 100 万 token 的长上下文推理而设计。
在周二的 AI 基础设施峰会上,英伟达宣布推出一款名为Rubin CPX(Rubin Context GPUs)的新 GPU,专为超过 100 万 token 的长上下文推理而设计。
英伟达今日宣布推出新产品Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。